ChatGPTで社員の心を分析できるか?
私が経営しているベイジという会社には日報という制度があり、毎日社員が日報をアップしてくれています。
この日報をChatGPTに読み込ませて診断してもらうことで、社員のメンタルの状態を観測できるのではないかと思いました。
そこで、「使っていいですよ」と承諾してくれた社員の日報を元に、少し実験をしてみました。
感情パラメーターの設計
いきなり漠然とChatGPTに分析させるのではなく、評価基準を設定することで、客観的かつ定量的な評価がしやすくなり、時系列の比較や他者との比較がしやすくなると考えました。
ただ、私自身は感情やメンタルの専門ではないので、それ自体をまずChatGPTに問いかけてみました。
それっぽいものが出てきました。ただ、似たようなものが並んでいたり、「それって感情?」と思うようなものが混じってたりと、いまいち精度が低いようにも思いました。
そこでこれはこれで参考にしつつ、この分野の専門家はどのような感情的要素を取り上げているかを、ChatGPTに問いかけてみました。
実は、仕事のパフォーマンスと関係する感情要素に関する参考文献については、過去にも何度かChatGPTに聞いているのですが、ダニエル・ゴールマンの『EQ』が、ほぼ確実に取り上げられる傾向にあります。他には、ダニエル・ピンクの『Drive:The Surprising Truth About What Motivates Us(邦題:モチベーション3.0)』、ショーン・エイカーの『The Happiness Advantage(邦題:幸福優位7つの法則)』やキャロル・S・デュエックの『Mindset(邦題:マインドセット~「やればできる!」の研究)』などが引用されることもありました。
これらの本のいくつかは私の手元にあったので、ChatGPTの提案に書籍の内容を加味し、さらに私の経験も加えたうえで、以下のような感情パラメーターを定義してみました。
ポジティブ要素
- リーダーシップ
- モチベーション
- 自信
- 心の安定
- 感謝
- 共感
- 満足感
ネガティブ要素
- 不安
- 焦り
- 恐怖
- 怒り
- 無気力
- 疲労
- 不満
実運用を考えるとやや多すぎる気もしますが、ひとまず実験なので多めに設定してみました。そして、この感情パラメーターの設定自体の妥当性を、ChatGPTに確認してみました。
私はChatGPTに「これって正しい?」「これって適切」とよく聞くのですが、そんな時に褒められることが多く、「明確に正解がないことについては何を入れてもとりあえず褒めてくる」という疑念を持ってはいます。ただおそらく、基本的な抜け漏れはないのだろうと思えたので、改めてこの感情パラメーターで、社員の日報を分析してみることにしました。
日報の診断
まず、デザイナーTMさん日報について、評価してもらいました。
私は、各パラメーターごとに数字だけが並んだアウトプットを想像していたのですが、「なぜその値なのか」の説明まで加えられていて、ちょっと感動してしまいました。なのでこの次の投稿では、思わず感激の気持ちをChatGPTに伝えてしまいました。(AIにもポジティブフィードバックをした方がコミュニケーションがスムーズになるのではと思ってる派)
肝心の分析内容ですが、文章と照らし合わせてみても、実に妥当だと思いました。こうした数字への置き換えって、人為的にすると「この場合は3だろうか?4だろうか?」「あの項目を4にするのなら、こっちの項目は3じゃないとおかしいな」などと考えて結構時間がかかるものですが、こうした評価を機械的に瞬時に行ってくれるというのは、まさにAI様様であり、人間では不可能なことです。
この精度の高さは他の日報でも可能なのかとすぐに確かめたくなり、次にKPT(Keep,Problem,Try)で日報を書いている、エンジニアKBさんの日報を分析してみました。
やはり丁寧な解説付きで、内容もとても適切に感じました。ただ、社内に公開される日報という特性上、恐怖や怒りについて言及される機会は少ないため、ネガティブ要素の後半は、日報の分析にはあまり活かされないかもな、と思いました。感情パラメーターの設定の仕方には、もう少し工夫が必要そうです。
その調整はひとまずここでは入れずに、次にコンサルタントのNMさんの日報を分析してみました。
採点自体に違和感はないのですが、なんだか理由の説明が雑になった気がします。
また、改めてよく見てみると、「言及がない」ことに対して、ポジティブ要素だと3点、ネガティブ要素だと1点と採点しており、このあたりの採点基準に統一感がないように思います。ただ、「ポジティブなことは高めに評価し、ネガティブなことは低めに評価したい」というのは、善良な人の心理に近い気がして、ちょっと人間らしい揺らぎだな、とも思いました。
ともあれ、これを正式に運用するのであれば、1~5の採点基準をもう少し細かく定義したプロンプトを設計して渡す必要がある気がします。
さて、最後にデザイナーのKSさんの日報の分析です。
やはり、言及がないことに対する評価は割と適当です。ほとんどが2~4というぼんやりした評価になってしまいました。もちろん日によってはほとんど3前後という日があるはずで、それ自体が問題というわけではありません。ただ、メンタルの変化を察知するには、毎日の採点とその推移の比較をする必要があり、ピンポイントで1日だけ見てもあまり効果的には使えない、という風に思いました。(やる前からそうだろうなと思っていたことですが)
より定性的な分析
採点はパッと見の分かりやすさはあるものの、「その数字をどう解釈すればいいのか」という難しさが必ず付きまとうので、もっとざっくばらんに、それぞれの日報を500字くらいで総括してもらいました。
まずは最初に取り上げたデザイナーのTMさん。
TMさんは女性なのですが、性別情報を何も入れないと「彼」と決めつけてくるのは、ジェンダー的な問題を含んでいる気がします。そのことを除くと、とても分かりやすく的確な総括だと思いました。先ほどの感情パラメーターとこの500字の総括だけで、かなり立派な考察レポートができあがると思いました。
続いて、エンジニアのKBさん、コンサルタントのNMさん、デザイナーのKSさんの日報も、同じように分析してもらいました。
こうして複数の分析を見てみると、読めば分かるような当たり前のことしか書いてない、と批判的に見ることもできそうです。しかし私は、「当たり前」に気づかせてくれることに価値があると思いました。なぜなら人の判断には必ず認識の偏りや思い込みが介在し、「当たり前」が見えなくなることが多いからです。
例えば最後のデザイナーKMさんを「デザインプロセスにおける心理的な側面を深く考え、自分のメンタル状態を向上させることに取り組んでいます」と評価していましたが、私はKMさんの日報を読んだときに「悩んでいる」という部分にフォーカスし、「解決しようと取り組んでいる」という部分はあまり強く感じませんでした。人間は適当なので、最後の方に書いてある文章の精読率が落ちる、みたいなこともあると思います。
こうした人間特有のムラ、揺らぎ、認識の偏り、思い込み、集中力の欠如がなく、文章をストレートに客観的に評価してくれる、しかも超高速に、というのはAIを活用する最大のメリットではないかと思います。
社員の感想
最も大事なのは、こうしたChatGPTによる分析を受けた社員側の気持ちです。「分析に使っていい」と快諾してくれた社員ばかりという前提はありますが、皆、感想は比較的ポジティブなものでした。(以下、一部内容を抜粋・編集)
デザイナーTMさん
内容はかねがね当たっているような気がします…! 自己評価が上がってるという自分が気づかないポイントの言及があり、自分が知らない自分の気持ちを発見できました。ChatGPTに評価されて嬉しいとも嬉しくないともなりませんでしたが、純粋にこんな分析結果になるんだ!という知的好奇心を満たされました。そういう意味で言うとポジティブな感情に近いかもです。どんなデータを食わせたらいいかはわかりかねますが、その人の行動やふるまいに関してAIが客観的な評価をしてくれる役割を果たしてくれると嬉しいかもしれません!
エンジニアKBさん
内容が鋭く、「こんなものがこの要素に定義されるんだ〜」という驚きと面白さを感じました。 評価内容は共感できることが多いです。 日々考えたことに対するFBの参考になり、振り返る機会にもなりそうです。 ただ、他者から許可なしで利用されると少しネガティブなることもりそうで、使う場合はやはり事前許可などが必要だと思います。
コンサルタントNMさん
ひとつの日報だけでは参考にならないし、これをこのまま他の方に受け取ってほしくないな、とは感じた。 ただ、日報を書いていたときの気持ちを振り返ると、納得のいく評価だと思えた。 特に、私の「焦りの程度感」のようなものを読み取っているところに驚いた。 こうやって、自分の文章が他の人目線でどう受け取られるかを、ChatGPTで確認するとよいのかもしれない。 また、ひとつのテーマや案件の状況などを毎日書き溜めて分析させたら、自分の成長の振り返りに役立つかも、と思った。
デザイナーKSさん
AIの評価内容は大体当たっているかも、という感覚だった。 ChatGPTの評価は嬉しい嬉しくないではなく、不思議な気持ちの方が強かった。笑 もう少し精度高くなると「めちゃくちゃ分かってくれる」という嬉しさを感じそうだが、同時に少しの怖さも出てきそう...。(人間を超えてきた、みたいな気持ち) こういう取り組みは、社員のストレスチェックに使えるのではないか?と思った。 かつて受けたストレスチェックは無機質な感じがしたが、AIがもっと個人に寄り添った結果を出せるようになると、受けた側もやる意味を感じるのでは?と思った。
私の所感
個人的には、「人を評価する」「気持ちを汲み取る」などというものはAIからは最も遠い領域にあり、仮にAI化されるとしても、一番最後に来る領域だと思っています。またChatGPTが何度も警告しているように、感情を分析されるというのは必ずしも嬉しい行為ではないため、安易な機械化や自動化は避けるべきでしょう。
ただ前述の通り、人間だからこそ偏る、見過ごす、誤解する、ということは往々にして起こります。AIによる感情分析の自動化ではなく、マネジメントをサポートする手段の一つとしては、現実的な選択肢になりえるように思います。これまでも人の能力や感情を定量的に測る手段はありましたが、それが随分と身近に手に入るように、かつ自分たち好みにチューニングしやすくなったように思います。
実験なのでプロンプトなどまだ甘いですが、本格的にチューニングを加えていったら、実運用可能なものに仕上がりそうな予感もします。是非皆さんも、会社や組織文化に合わせたオリジナルの感情分析ツールを作ってみてはいかがでしょうか。